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PROBABILITES. 

SUR  LA  CONSTANCE  DES  CAUSES, 


M.  Jules  Bieuaymé  expose  un  principe  de  probabilités  qu’il  croit 
entièrement  nouveau,  et  qui  lui  paraît  susceptible  de  recevoir  des 
applications  continuelles  dans  les  sciences  d’observation.  Voici  en 
quoi  consiste  ce  principe. 

Lorsqu’on  a fait  un  grand  nombre  d’expériences,  ou  qu’on  a re- 
cueilli une  masse  de  renseignements  statistiques  pour  en  déduire 
un  certain  résultat  moyen,  on  peut  les  partager  en  plusieurs  grou- 
pes, soit  d’après  l’ordre  dans  lequel  les  expériences  ont  été  effec- 
tuées, soit  d’après  toute  autre  considération  particulière  à ces 
expériences.  Si  l’on  détermine  ensuite  les  résultats  moyens  de  cha 
cun  de  ces  groupes  naturels,  on  conçoit  qu’ils  différeront  plus  ou 
moins  entre  eux,  et  qu’ils  s’écarteront  plus  ou  moins  du  résultat 
général.  D’ordinaire  il  se  trouvera  des  écarts  d’autant  plus  grands, 
que  les  groupes  seront  plus  multipliés.  Il  est  facile  de  voir  que  l’é- 
tendue de  ces  écarts  doit  dépendre  durésultat  observé;  mais  il  semble 
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au  premier  coup-d’œil  qu’elle  (tev  A inégalement  dépendre  de  la 
possibilité  que  donne  aux  phénomènes  en  question  la  cause  ou  le 
système  de  causes  qui  les  régit.  Cependant  il  n’en  est  rien,  quand 
ce  système  de  causes  reste  constant  pendant  toute  la  durée  des 
expériences.  On  démontre  sans  peine  que,  dans  ce  cas,  les  rela- 
tions de  probabilité  qui  doivent  exister  entre  le  résultat  général  et 
les  résultats  partiels  sont  absolument  indépendantes  de  la  possibilité 
des  phénomènes;  il  n’entre  dans  les  expressions  qui  les  caractérisent 
que  les  résultats  seuls  des  observations  faites,  même  alors  que  la  loi 
de  possibilité  des  phénomènes  est  connue  à l’avance. 

Ainsi,  par  exemple,  si  l’on  tient  note  des  résultats  de  120,000 
coups  d’un  dé  ordinaire,  on  saura  d’avance  que  la  possibilité  d’a- 
mener l’as  est  g,  de  sorte  que  ce  point  devra  se  présenter  à peu 
près  | del20,000,  ou  20,000  fois.  Cependant  il  pourra  arriver  que 
l’as,  au  lieu  de  paraître  à peu  près  une  fois  sur  6,  ne  se  montre  en 
1 20,000  coups  qu’une  fois  sur  20,  c’est-à-dire  environ  6,000  coups. 
Eh!  bien,  malgré  cette  différence  entre  le  rapport  observé  et  la 
possibilité  réelle,  quand  on  partagera  les  120,000  jets  de  dé  en 
plusieurs  séries,  et  qu’on  examinera  le  nombre  des  as  dans  cha- 
cune de  ces  séries,  comme  la  cause  sera  restée  constante , on  trou- 
vera que  les  séries  partielles  donnent  à peu  près  des  nombres  d’as 
proportionnels  au  nombre  des  as  contenu  dans  la  série  totale;  et 
cela  d’autant  plus  exactement  que  les  séries  partielles  contiendront 
chacune  plus  de  coups  de  dé.  Si  le  rapport  total  des  as  s’est  trouvé 
de  | à peu  près,  sur  les  120,000  épreuves,  ce  sera  encore  cette 
fraction  £qui  régira  les  séries  partielles,  et  chacune  d’elles  offrira, 
à certains  écarts  près  , environ  f d’as.  Si,  au  contraire,  le  rapport 
total  s’est  trouvé  de  nonobstant  la  possibilité  constante  £ de  la 
face  du  dé  qui  porte  l’as , ce  sera  la  fraction  qui  régira  les  séries 
partielles,  et  il  se  rencontrera  dans  chacune  d’elles  ^ d’as,  tou- 
jours à certains  écarts  près,  dont  la  probabilité  est  assignable. 

Cependant,  comme  il  vient  d’être  dit,  chaque  série  partielle, 
dans  ce  dernier  cas  comme  dans  le  premier,  aura  été  formée 
sous  l’influence  de  la  possibilité  £;  et  il  semblerait  à priori 
que  cette  possibilité  dût  donner  un  grand  nombre  de  séries  où 
il  se  trouverait  £ d’as  : de  sorte  qu’elle  n’aurait  fourni  le  rap- 
port extraordinaire  ^ sur  l’ensemble  des  120,000  épreuves  que 
par  quelques  séries  fort  rares  qui  s’écarteraient  excessivement  du 
rapport  de  possibilité  £.  Mais  cette  présupposition  serait  inexacte; 
et  au  contraire,  quand  l’ensemble  des  coups  de  dés  fournit  le  rap- 
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port  si  éloigué  du  rapport  réel  de  possibilité  il  devient  extrê- 
mement probable,  moralement  certain  (pour  employer  l’expres. 
sion  de  Jacques  Bernoulli)  que  les  séries  partielles,  même  très  mul- 
tipliées, s’écarteront  peu  du  rapport 


La  démonstration  du  principe  qui  assure  ce  résultat  est  très 
simple.  Supposons  qu’on  ait  exécuté  un  grand  nombre  c de  tirages 
dans  une  urne  contenant  des  boules  blanches  et  des  boules  noires 
dans  un  rapport  connu,  tel  que  p soit  la  possibilité  d’amener  une 
boule  blanche.  Supposons  eucore  qu’il  soit  sorti  a boules  blanches 
et  b noires , et  qu’on  partage  le  nombre  total  c des  tirages  en 
deux  séries,  la  première  de  m et  la  deuxième  de  n tirages.  On  sait 
que  la  probabilité  d’amener  dans  la  première  série  d’épreuves  r 
boules  blanches,  dont  la  possibilité  est  p , s’exprime  par  le  terme 
du  développement  de  la  puissance  m du  binôme  p + (1 — p),  dans 
lequel  p a l’exposant  r,  soit  : 


m . m — 1 . m — 2 

tt  2 ; 3~ 


m — r + 1 


]/’(!  — p) 


m — r 


Semblablement  la  probabilité  d’amener  q boules  blanches  dans 
la  deuxième  série  d’épreuves,  sera 


n . n — 1 n — q - f 1 

ÎT  2 T7  q 


p<!  (1  p)  n-O' 


Partant  le  concours  des  deux  événements  (r  boules  blanches 
dans  la  première  série , et  q boules  blanches  dans  la  deuxième) 
aura  pour  probabilité  le  produit  des  deux  précédentes,  soit  : 


m.m — i..m — r+1  n.n — 1 ..n — q -f  1 

Tnrr. — — v 2 \ 

Maintenant  il  convient  d’observer  que  les  épreuves  sont  laites, 
et  qu’il  est  sorti  a boules  blanches  sur  le  total  c = m -t-  n des 
épreuves  : de  sorte  que  les  deux  nombres  de  blanches  r et  q , dans 
les  deux  séries  partielles,  sont  assujétis  à la  condition  r + q = a. 
Chacun  de  ces  nombres  ne  peut  donc  varier  que  depuis  o jus- 
qu’à a : ce  qui  rend  impossibles  un  grand  nombre  de  cas  qui  pou- 
vaient arriver  dans  deux  séries  d’épreuves.  11  n’y  a dès  lors  lieu 
de  considérer  parmi  les  valeurs  de  la  probabilité  ci-dessus  que 
celles  qui  sont  données  par  la  condition  r q = a : et  puisque 
ces  valeurs  deviennent  seules  possibles,  il  faut  en  faire  la  somme, 
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et  diviser  l’expression  précédente  par  cette  somme.  Or,  on  recon- 
naît sans  difficulté  que  la  somme  dont  il  s’agit  est 

«î  -f  » . m + « — 1 m + n — a + 1 

~ l 2 T3 r (1  ~v)C~a- 

c . c — 1 c — a + 1 

0U  1 ~ 2 ~ pa  (1  ~P)>- 

Le  quotient  de  la  probabilité  ci-dessus  par  cette  somme  est 


m.m — l..m — r + 1 n.n — 1 ..n — q + 1 

— à ■ r x — — - r“pr  T v -py,+n-r-"- 


î 


c — a 4-1 
a 


(1  — p)c 


a 


et  l’on  voit  qu’à  cause  de  c = m -f-  n et  a = r + q,  la  possibilité  p 
disparaît  complètement  de  ce  quotient. 

Ainsi  la  probabilité  de  trouver  r boules  blanches  dans  la  pre- 
mière série  , et  q = a — r blanches  dans  la  deuxième  , quand  on 
partage  en  deux  séries  un  nombre  total  c de  tirages  qui  a donné  a 
boules  blanches,  est  simplement 

m.m  — 1 ....  m — r + 1 n.n — 1 ....  n — ? + l 

1 . 2 r X 1 . 2 q 

c . c — 1 c — a -\-  1 

T.  2 ITT  a 


expression  dans  laquelle  il  ne  reste  plus  que  les  résultats  des  ti- 
rages, c’est-à-dire  des  faits  observés. 

Avec  un  peu  d’attention  , on  reconnaît  dans  cette  expression  la 
suivante  : 

a . a — 1 . a — 2 ....  a — r -f- 1 x b . b — 1 . b — 2 ....  b — m + r + 1 
c . c — 1 . c— 2 c—m  -H  1 

m.m  — 1 m — r-fl 

X TT  2 TT  r"~ 

qui  est  la  possibilité  de  tirer  r boules  blanches  et  (m — r)  noires 
d’une  urne  contenant  c boules,  dont  a blanches  et  b noires,  quand 
on  y prend  m boules  au  hazard,  sans  en  remettre  aucune. 
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Les  relations  de  probabilité  entre  les  séries  partielles  et  la  série 
totale  des  épreuves,  ou  des  expériences,  sont  donc  non  seulement 
indépendantes  de  la  possibilité  réelle  des  événements,  mais  de  plus 
elles  sont  les  mêmes  que  si  les  faits  dont  se  compose  une  série  par- 
tielle avaient.  été  tirés  au  hasard  delà  série  totale  des  faits  observés. 

L’application  de  ce  principe  (qui  s’étend  d’ailleurs  à tous  les  cas 
de  probabilités  constantes  , quel  que  soit  le  nombre  des  espèces 
d’événements  dont  le  résultat  se  compose)  sera  très  aisée  à faire. 

Lorsqu’il  importera  de  connaître  si  la  cause  , ou  le  système  de 
causes,  qui  a régi  une  série  d’expériences,  n’a  point  subi  de  va- 
riation pendant  la  durée  de  ces  expériences , il  suffira  de  les  divi- 
ser en  séries  partielles,  et  de  calculer  si  les  écarts  des  résultats 
moyens  de  ces  subdivisions  sont  renfermés  dans  les  limites  que  leur 
assigne  le  résultat  moyen  général , en  vertu  du  nouveau  principe. 

Il  est  fort  digne  de  remarque,  ajoute  M.  Bienaymé,  qu’on  pourra 
conclure  par  ce  procédé,  que  la  cause  a été  constante  ou  variable, 
sans  rien  préjuger  sur  la  possibilité  réelle  qu’elle  peut  donner  aux 
phénomènes.  Cette  conclusion  subsistera , quand  même  le  résultat 
moyen  s’écarterait  complètement  de  la  valeur  de  cette  possibilité  , 
et  que  par  conséquent  il  donnerait  à l’observateur  une  idée  tout- 
à-fait  inexacte  de  cette  valeur.  C’est  là  une  conséquence  impor- 
tante, car  il  en  ressort  que  la  statistique,  et  en  général  les  sciences 
d’observation,  peuvent  toujours  fournir  des  données  positives  sur 
la  constance  des  lois  naturelles , indépendamment  de  la  valeur  de 
ces  lois. 

Voici  la  formule  à employer  quand  on  divise  seulement  en  deux 
parties  la  série  des  observations , et  qu’il  ne  s’agit  que  de  deux 
phénomènes  exclusifs  l’un  de  l’autre,  comme  le  sont  la  sortie  d’une 
boule  noire  et  la  sortie  d’une  blanche  dans  une  suite  de  tirages. 

En  conservant  les  lettres  déjà  employées , on  supposera  qu’il  a 
été  observé  a phénomènes  d’un  certain  genre  sur  un  grand  nombre 
c d’expériences,  et  que  le  phénomène  contraire  a par  suite  eu  lieu 
c — a = b fois.  Si  l’on  prend  une  série  partielle  de  m de  ces  obser- 
vations, on  doit  trouver,  dans  l’hypothèse  d’une  cause  constante, 
que  le  nombre  des  phénomènes  dont  il  s’est  présenté  a sur  la  masse, 
est,  pour  la  série  partielle,  compris  entre  les  limites 
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ab 

~c? 


c — m 


étant  le  plus  grand  nombre  entier  renfermé  dans  (m  + 1) 


«f  1 \ 

c-J—  2 / 


avec  une  probabilité,  exprimée  par 


1 

V/  7T 


r c3 


Le  plus  souvent  la  division  en  deux  séries  suffira  pour  manifes- 
ter la  constance  ou  l’inconstance  de  la  cause.  Car  on  peut  remar- 
quer que  les  limites  précédentes  sont  très  étroites. 

Fourier,  dans  les  Recherches  statistiques  sur  Paris,  avait  con- 
seillé de  séparer  les  observations  en  groupes , afin  de  reconnaître 
par  les  écarts  des  résultats  partiels,  si  Ton  pouvait  accorder 
quelque  confiance  au  résultat  moyen  général.  Mais  il  n’a  donné 
aucune  règle  à ce  sujet.  L’incertitude  subsistait  donc.  On  avait 
même  appliqué  à l’examen  des  résultats  partiels  une  formule  de 
Laplace,  qui  se  rapporte  à un  problème  très  différent  du  problème 
actuel  : c'est  celle  qui  exprime  les  écarts  probables  d’un  nombre  m 
de  nouvelles  épreuves  , quand  déjà  on  a fait  c expériences  qui  ont 
donné  a fois  le  phénomène  attendu.  Les  limites  du  nombre  r des 
répétitions  de  ce  phénomène  dans  ces  m épreuves  nouvelles  (et  non 
dans  m des  c épreuves  déjà  faites),  sont  : 


r = N zi:  ul/  2 — 

Y C2 


c H-  m 

m 

c 


avec  une  probabilité 


Ici  N est  le  plus  grand  nombre  entier  contenu  dans  (m  + 1) 

On  voit  que  ces  limites  sont  plus  grandes  que  celles  qui  résultent 
du  principe  énoncé.  Elles  les  surpassent  dans  le  rapport  de  V c + m 
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à n/c — m (par  exemple  de  ^3  à 1,  si  m = f c).  On  était  par 
suite  exposé,  en  les  employant,  à regarder  comme  résultats  d’une 
cause  constante  des  écarts  beaucoup  trop  considérables  , et  qui 
indiquaient  positivement  l’existence  d’une  cause  variable. 

On  comprend  sur-le-champ  que  les  limites  des  écarts  des  nom- 
bres qui  ont  concouru  à former  un  résultat  moyen  , doivent  être 
bien  moindres  que  ne  le  sont  celles  de  nombres  qui  n’y  ont  pas 
contribué  , bien  que  les  uns  et  les  autres  soient  régis  par  la  même 
possibilité  constante.  Cette  prévision  s’accorde  avec  les  formules 
qui  dérivent  du  principe  nouveau.  Elles  ne  dépendent  plus  que  des 
termes  du  développement  du  binôme  des  factorielles  : on  peut  s’en 
assurer.  Et  le  plus  grand  terme  de  cette  suite,  ainsi  que  ceux  qui 
l’avoisinent,  sont  relativement  plus  grands  que  les  termes  corres- 
pondants du  développement  du  binôme  des  puissances.  De  là  des 
écarts  moindres  pour  une  même  probabilité. 
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